in
AI उत्पाद रैंकिंग
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
होम
AI समाचार
AI दैनिक
मुद्रीकरण गाइड
AI ट्यूटोरियल
AI उपकरण नेविगेशन
AI उत्पाद लाइब्रेरी
in
AI उत्पाद रैंकिंग
वैश्विक AI उत्पाद गतिशीलता खोजें
वैश्विक AI जानकारी खोजें, AI में नए अवसर खोजें
समाचार जानकारी
उत्पाद अनुप्रयोग
मुद्रीकरण मामले
AI ट्यूटोरियल
प्रकार :
समाचार जानकारी
उत्पाद अनुप्रयोग
मुद्रीकरण मामले
AI ट्यूटोरियल
2025-02-12 09:14:56
.
AIbase
.
15.3k
小红书 द्वारा विकसित ओपन-सोर्स वॉइस रिकॉग्निशन मॉडल FireRedASR, चीनी भाषा की पहचान में उत्कृष्ट सटीकता
वॉइस रिकॉग्निशन के क्षेत्र में, चीनी भाषा पहचान की तकनीक का विकास हमेशा ध्यान आकर्षित करता रहा है। हाल ही में, 小红书 की FireRed टीम ने एक नया ओपन-सोर्स वॉइस रिकॉग्निशन मॉडल लॉन्च किया - FireRedASR। यह बड़े मॉडल पर आधारित वॉइस रिकॉग्निशन सिस्टम विभिन्न मानक टेस्ट सेट पर उत्कृष्ट परिणाम प्राप्त करता है, जो चीनी वॉइस रिकॉग्निशन तकनीक में एक महत्वपूर्ण सफलता को दर्शाता है। FireRedASR का मुख्य मानक है शब्द त्रुटि दर (CER), यह मान जितना कम होगा, मॉडल की पहचान क्षमता उतनी ही बेहतर होगी। हाल की सार्वजनिक परीक्षा में, Fi
2024-08-22 08:34:49
.
AIbase
.
11.2k
बाइट बीन बैग वॉइस मॉडल और विजुअल मॉडल अपग्रेड, समग्र क्षमता में 20.3% की वृद्धि
21 अगस्त 2024 को वोल्केन इंजन AI नवाचार प्रदर्शनी में शंघाई में, वोल्केन इंजन ने बीन बैग बड़े मॉडल के व्यापक अपग्रेड का प्रदर्शन किया, जिसमें बीन बैग·वर्तमान चित्र मॉडल की लंबी पाठ के लिए अधिक सटीक चित्र-टेक्स्ट मिलान क्षमता शामिल है, बीन बैग·वॉइस रिकॉग्निशन मॉडल कई सार्वजनिक परीक्षण सेटों में सबसे अधिक 40% तक की गलती दर में कमी आई है, और बीन बैग·वॉइस सिंथेसिस मॉडल ने स्ट्रीमिंग वॉइस सिंथेसिस क्षमता को अपग्रेड किया है, जो वास्तविक समय में प्रतिक्रिया करने और सटीक रूप से वाक्य को काटने में सक्षम है। वोल्केन इंजन ने एक संवादात्मक AI वास्तविक समय इंटरएक्शन समाधान भी जारी किया, जो बीन बैग बड़े मॉडल और वास्तविक समय ऑडियो-वीडियो तकनीक को समेकित करता है, अंत-से-अंत की सेवा प्रदान करता है।